| Переменные | N | Overall, N = 621 | Описательная статистика по стратегии | p-value2 | |
|---|---|---|---|---|---|
| Aphakia, N = 251 | Artephakia, N = 371 | ||||
| age_flwp | 62 | 0.011 | |||
| Median(IQR) | 11.45(5.23) | 10.30(2.50) | 13.30(5.90) | ||
| Mean±SD | 11.63±3.24 | 10.31±2.20 | 12.53±3.55 | ||
| Minimum; Maximum | 6.20; 17.00 | 6.40; 15.70 | 6.20; 17.00 | ||
| side | 62 | >0.9 | |||
| L | 27(44%) | 11(44%) | 16(43%) | ||
| R | 35(56%) | 14(56%) | 21(57%) | ||
| glau | 62 | 25(40%) | 12(48%) | 13(35%) | 0.3 |
| bcdva | 62 | 0.082 | |||
| Median(IQR) | 0.10(0.18) | 0.06(0.12) | 0.12(0.24) | ||
| Mean±SD | 0.16±0.19 | 0.12±0.15 | 0.19±0.21 | ||
| Minimum; Maximum | 0.00; 0.80 | 0.00; 0.65 | 0.01; 0.80 | ||
| bcnva | 62 | 0.6 | |||
| Median(IQR) | 0.26(0.41) | 0.20(0.41) | 0.30(0.42) | ||
| Mean±SD | 0.32±0.27 | 0.29±0.24 | 0.35±0.30 | ||
| Minimum; Maximum | 0.02; 0.95 | 0.02; 0.76 | 0.02; 0.95 | ||
| 1 Median (IQR), Mean±std, Min; Max, or N(Frequency) | |||||
| 2 Wilcoxon rank sum test; Pearson’s Chi-squared test; Wilcoxon rank sum exact test | |||||
| Переменные | N | Overall, N = 621 | Описательная статистика по наличию глаукомы | p-value2 | |
|---|---|---|---|---|---|
| No, N = 371 | Yes, N = 251 | ||||
| age_flwp | 62 | 0.4 | |||
| Median(IQR) | 11.45(5.23) | 11.60(5.80) | 11.40(4.30) | ||
| Mean±SD | 11.63±3.24 | 11.93±3.34 | 11.20±3.12 | ||
| Minimum; Maximum | 6.20; 17.00 | 6.20; 16.90 | 6.40; 17.00 | ||
| strat | 62 | 0.3 | |||
| Aphakia | 25(40%) | 13(35%) | 12(48%) | ||
| Artephakia | 37(60%) | 24(65%) | 13(52%) | ||
| side | 62 | 0.6 | |||
| L | 27(44%) | 15(41%) | 12(48%) | ||
| R | 35(56%) | 22(59%) | 13(52%) | ||
| bcdva | 62 | 0.062 | |||
| Median(IQR) | 0.10(0.18) | 0.12(0.17) | 0.05(0.10) | ||
| Mean±SD | 0.16±0.19 | 0.18±0.17 | 0.14±0.21 | ||
| Minimum; Maximum | 0.00; 0.80 | 0.01; 0.79 | 0.00; 0.80 | ||
| bcnva | 62 | 0.6 | |||
| Median(IQR) | 0.26(0.41) | 0.30(0.41) | 0.18(0.30) | ||
| Mean±SD | 0.32±0.27 | 0.34±0.29 | 0.29±0.25 | ||
| Minimum; Maximum | 0.02; 0.95 | 0.02; 0.95 | 0.04; 0.90 | ||
| 1 Median (IQR), Mean±std, Min; Max, or N(Frequency) | |||||
| 2 Wilcoxon rank sum test; Pearson’s Chi-squared test; Wilcoxon rank sum exact test | |||||
Оценка функции плотности вероятности для острот зрения показывает, что острота зрения вдали в бОльшей степени инфильтрирована низкими значениями. Таким образом, можно сказать, основываясь на наших данных, восстановление остроты зрения вблизи для больных врожденной катарактой происходит лучше, чем то же для зрения вдали. Посмотрим то же по стратегиям лечения.
Для острот вдали и вблизи мы наблюдаем небольшое смещение в сторону повышение острот в группах со стратегией лечения Артефакия. Также, для остроты зрения вблизи показали, что распределение двуглавое: т.е. имеются 2 группы пациентов, одна из которых, возможно, лучше отвечает на стратегию лечения, чем другая. Видно, что мода распределения остроты зрения вблизи для распределения с лучшим ответом для афакии ниже, чем аналогичная для артефакии. Для остроты зрения вдали группу с бОльшей остротой зрения выбрать трудно, хотя такие пациенты есть, их немного.
При стратификации по признаку глаукомы наблюдаем похожую картину. Распределение остроты зрения вдали инфильтрированно низкими значениями, т.е. по данному признаку восстановление имеет низкую частоту. В группе без глаукомы острота выше по медиане и среднему. Для остроты зрения вблизи разделенной по наличию глаукомы снова наблюдаем двуглавое распределение, пересекающееся где-то на 0.5 для шкалы. Здесь гораздо больше значений превышающих 0.5, чем для остроты вдали. В группе без глаукомы острота зрения вблизи также выше по медиане и среднему.
Выводы по распределениям признаков. Распределения острот зрения не похожи на нормальные, и при этом количество пациентов в выборке не дает нам с большой уверенностью полагаться на ЦПТ.
Для остроты зрения вдали при обеих стратегиях характерны распределения, инфильтрированные низкими значениями. Попробую логарифмировать эту переменную, добавив сдвиг к нулю, чтобы логарифм был определен во всем диапазоне чисел. То, что логарифм будет отрицательным, мне неважно, поскольку я буду моделировать признак линейной регрессией, и она предполагает непрерывность зависимой переменной. При интерпретации коэффициентов я буду применять обратное преобразование, т.е. экспоненциальную функцию с вычетом сдвига, к коэффициентам модели. Тогда коэффициенты будут интерпретироваться как увеличение зависимой переменной в exp(beta) раз в исследуемой группе для положительного beta и уменьшение в 1/exp(beta) раз для отрицательного beta, поскольку отношение между beta и переменной изменится со сложения на умножение. Ниже построю QQ plot для лог-нормального распределения (т.е. распределения переменной, чей логарифм распределен нормально).
Для остроты зрения вблизи особенно при стратификации были видны 2 пересекающихся распределения c двумя модами. Т.к. вычленять их я не умею, и судя по всему это сложно, я попробую бинаризовать переменную по отсечке 0.5 и предсказывать переменную логистической регрессией, которая также легко интерпретируется, поскольку ее коэффициенты преобразуются в отношение шансов. Отсечка, во первых, является середной для шкалы - она изменяется от 0 дло 1. Во-вторых, во всех случаях моды двух распределений разделялись по этим отсечкам.## [1] "В распределении остроты зрения после добавления шума нет значений, равных 0"
Видим, что распределение логарифма действительно похоже на нормальное. Добавление сдвига при этом помогло определить логарифм для всех значений.
Почти для всех точек квантили распределены также, как теоретические, крмое последних шести точек. Это говорит о том, что верхние квантили отклоняются от логнормального распределения. Тем не менее, это хороший результат, который можно брать в работу.
Бинаризация переменной при простом пересечении выделяет группу со стратегией лечения Артефакия как обогащенную значениями остроты зрения меньше 0.5. Но нормализация по стратегиям не показывает какого-то явного обогащения.
Для остроты зрения вдали не наблюдается монотонной связи с возрастом при артефакии, и наблюдается отрицательная значимая корреляция (-0.47) с возрастом при афакии (p<0.05). Для остроты зрения вблизи для стратегии артефакии наблюдается значимая положительная корреляция c возрастом на уровне значимости 0.1 с коэффициентом корреляции 0.27. Для стратегии афакии наблюдается значимая отрицательная корреляция с возрастом (p<0.01) с коэффициентов корреляции -0.61. Таким образом, можно сказать, что с возрастом зрение ухудшается после афакии, и это скорее не так после артефакии. Это может быть связано с тем, что имплантация искусственного хрусталика по мере роста ребенка помогает поддерживать нормальную анатомию глаза, что способствует более правильному развитию зрения и видимо это более заметно для зрения вблизи. Ухудшение остроты зрения вблизи с возрастом после афакии может быть связано с отсутствием хрусталика, что может влиять на анатомическое развитие глаза. Даже если для коррекции зрения используются контактные линзы, они могут не полностью компенсировать отсутствие естественного хрусталика.
Независимо от того, есть у пациента глаукома или нет, монотонной связи остроты зрения с возрастом не наблюдается. Это можно объяснить тем, что, возможно, темп прогрессирования глаукомы очень индивидуален, и потому не отражается в монотонной связи с возрастом.
На уровне значимости 0.05 в группе со стратегией артефакии и без глаукомы острота зрения вдали значения острот зрения как правило больше, чем в в группах со стратегией афакии (с и без глаукомы), и то же верно на уровне значимости 0.1 по сравнению с группой артефакии и глаукомы. Стоит отметить, что эти связи незначимы после поправки на множественные сравнения, что, возможно, говорит о малой выборке (62 пациента). Для остроты зрения вблизи мы не отвергаем нулевую гипотезу о том, что распределения двух групп идентичны, при разных стратегиях и при отсутствии и наличии глаукомы.
Для острот зрения вблизи и вдали мы не отвергаем нулевую гипотезу о том, что распределения двух групп идентичны, при разных стратегиях и при разных сторнах операции.
Для острот зрения вблизи и вдали мы не отвергаем нулевую гипотезу о том, что распределения двух групп идентичны, при разных сторнах операции и наличии или отсутствие глаукомы.
Для унивариантной модели наблюдаем незначительное отклонение от предпосылок нормальности и гомоскедастичности распределения остатков при предсказании остроты зрения вдали, при этом явных признаков кластеризации остатков не обнаружено. Проведем коррекцию на гетероскедастичность. Возьму улучшенную робастную оценку Уайта, с поправками на количество наблюдений и на влияение отдельных наблюдений.
Для унивариантной модели, предсказывающей лог-шкалированную остроту зрения вдали отклонения от нормальности и гомоскедастичности не наблюдается.
| Острота вблизи | Острота вблизи с коррекцией | Острота вблизи, log | |
|---|---|---|---|
| (Intercept) | 0.117 | 0.117 | −4.112 |
| [0.042, 0.192] | [0.055, 0.179] | [−4.846, −3.377] | |
| (0.003) | (<0.001) | (<0.001) | |
| stratArtephakia | 0.077 | 0.077 | 0.843 |
| [−0.020, 0.174] | [−0.015, 0.169] | [−0.108, 1.793] | |
| (0.118) | (0.098) | (0.081) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.040 | 0.050 | |
| R2 Adj. | 0.024 | 0.034 | |
| AIC | −27.5 | 86.5 | 255.2 |
| BIC | −21.1 | 214.1 | 261.6 |
| Log.Lik. | 16.742 | −124.595 | |
| F | 2.516 | 3.146 | |
| RMSE | 0.18 | 1.81 |
## [1] "Значение beta для модели после преобразования: 2.32 , 95% ДИ: [0.9, 6.01]"
## [1] "Добавление переменной 'side' не было значимым на уровне значимости 0.1 для всех моделей."
Можем заключить, что при отсутствии оснований исходя из анализа причинно-следственных связей и поскольку добавление этой переменной в модель не показывает улучшение модели ни в одном сеттинге, мы можем не добавлять этот предиктор для оценки связи стратегии лечения с остротой зрения вдали.
Сделаем то же для переменной взаимодействия.## [1] "Добавление переменной взаимодействия не было значимым на уровне значимости 0.1 для всех моделей."
Мы хотели учесть то, что, возможно для разных стратегий лечения острота зрения по-разному меняется с возрастом. Но эта гипотеза на наших данных не подтвердилась. Мы не будем брать переменную взаимодействия в анализ.
Теперь для итоговой модели: bcnva ~ age_flwp+strat проведем диагностику.Для модели с поправкой на ковариаты, предсказывающей остроту зрения вдали, как и в унивариантной модели видим небольшие отклонения от нормальности и гомоскедастичности. Введем ту же коррекцию.
Для модели с поправкой на ковариаты, предсказывающей лог-шкалированную остроту зрения вдали отклонения от нормальности и гомоскедастичности также не наблюдается.
| Острота вблизи | Острота вблизи с коррекцией | Острота вблизи, log | |
|---|---|---|---|
| (Intercept) | 0.231 | 0.231 | −2.411 |
| [0.054, 0.409] | [0.031, 0.431] | [−4.106, −0.716] | |
| (0.012) | (0.024) | (0.006) | |
| stratArtephakia | 0.102 | 0.102 | 1.208 |
| [−0.001, 0.204] | [0.005, 0.198] | [0.229, 2.187] | |
| (0.052) | (0.040) | (0.016) | |
| age_flwp | −0.011 | −0.011 | −0.165 |
| [−0.027, 0.005] | [−0.029, 0.007] | [−0.314, −0.016] | |
| (0.162) | (0.220) | (0.031) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.072 | 0.123 | |
| R2 Adj. | 0.040 | 0.093 | |
| AIC | −27.6 | 82.4 | 252.3 |
| BIC | −19.1 | 207.9 | 260.8 |
| Log.Lik. | 17.780 | −122.126 | |
| F | 2.283 | 4.121 | |
| RMSE | 0.18 | 1.73 |
## [1] "Значение beta для модели после преобразования: 3.35 , 95% ДИ: [1.26, 8.9]"
Видим, что нижний ДИ для модели с коррекцией и модели, предсказывающая преобразованную переменную, не пересекает 0.
Для унивариантной модели наблюдаем очень незначительное отклонение от предпосылок нормальности и гомоскедастичности распределения остатков при предсказании остроты зрения вблизи, при этом явных признаков кластеризации остатков не обнаружено. Проведем коррекцию на гетероскедастичность как для остроты вдали.
| Острота вблизи | Острота вблизи с коррекцией | Острота вблизи, log | |
|---|---|---|---|
| (Intercept) | 0.292 | 0.292 | −0.944 |
| [0.182, 0.402] | [0.197, 0.388] | [−1.889, −0.114] | |
| (<0.001) | (<0.001) | (0.034) | |
| stratArtephakia | 0.055 | 0.055 | −0.191 |
| [−0.088, 0.197] | [−0.082, 0.191] | [−1.344, 0.987] | |
| (0.446) | (0.427) | (0.746) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.010 | ||
| R2 Adj. | −0.007 | ||
| AIC | 19.6 | 133.6 | 74.7 |
| BIC | 26.0 | 261.2 | 79.0 |
| Log.Lik. | −6.810 | −35.351 | |
| F | 0.589 | 0.105 | |
| RMSE | 0.27 | 0.44 |
## [1] "Значение OR для модели после преобразования: 0.83 , 95% ДИ: [0.26, 2.68], уменьшение в 1.21 раз."
Интерпретация кооэффициентов. В группе со стратегией лечения Артефакия по сравнению со стратегией Афакия острота зрения вблизи выше в среднем на 0.055 [−0.082, 0.191, 95% ДИ]. Нижняя граница ДИ находится в отрицательной области значений, т.е. улучшение не является значимым.
## [1] "Добавление переменной 'side' не было значимым на уровне значимости 0.1 для всех моделей."
Можем заключить, что, как и в случае с остротой зрения вдали, при отсутствии оснований исходя из анализа причинно-следственных связей и поскольку добавление этой переменной в модель не показывает улучшение модели ни в одном сеттинге, мы можем не добавлять этот предиктор для оценки связи стратегии лечения с остротой зрения вдали.
Сделаем то же для переменной взаимодействия.## [1] "Добавление переменной взаимодействия было значимым на уровне значимости 0.1 для модели(ей): Модель для переменной"
Мы хотели учесть то, что, возможно для разных стратегий лечения острота зрения по-разному меняется с возрастом. Эта гипотеза подтвердилась для лучшей модели, как выяснили в унивариантном анализе - простом моделировании признака. Помним из EDA, что зависимость между возрастом и остротой зрения вблизи действительно была разной для стратегий. Возможно, наше предположение верно только для оценки этой зрительной функции, но не зрения вдали.
Теперь для итоговой модели: bcdva ~ age_flwp*strat проведем диагностику. Моделирование с помощью логит-функции для бинаризованной переменной не показало себя хорошо в предыдущем анализе, поэтому далее будем работать только с линейной регрессией.Для модели с поправкой на ковариаты, предсказывающей остроту зрения вблизи, как и в унивариантной модели видим небольшие отклонения от гомоскедастичности, но не от нормальности. Введем ту же коррекцию.
| Острота вблизи | Острота вблизи с коррекцией | |
|---|---|---|
| (Intercept) | 0.960 | 0.960 |
| [0.468, 1.452] | [0.600, 1.321] | |
| (<0.001) | (<0.001) | |
| stratArtephakia | −0.964 | −0.964 |
| [−1.545, −0.384] | [−1.402, −0.526] | |
| (0.002) | (<0.001) | |
| age_flwp | −0.065 | −0.065 |
| [−0.111, −0.018] | [−0.097, −0.033] | |
| (0.007) | (<0.001) | |
| stratArtephakia × age_flwp | 0.093 | 0.093 |
| [0.040, 0.145] | [0.053, 0.132] | |
| (<0.001) | (<0.001) | |
| Num.Obs. | 62 | 62 |
| R2 | 0.195 | |
| R2 Adj. | 0.153 | |
| AIC | 10.8 | 116.8 |
| BIC | 21.5 | 240.2 |
| Log.Lik. | −0.407 | |
| F | 4.669 | |
| RMSE | 0.24 |
## [1] "Отвергаем нулевую гипотезу об одновременном равенстве нулю коэффициентов для стратегии, возраста и их взаимодействия, p = 0.00546 . Факторы имеют статистически значимое влияние на зависимую переменную в модели."
Все ДИ предикторов не пересекают 0. То же подтверждает тестирование статистической гипотезы.
## [1] "Эффект артефакии при среднем возрасте 11.63 равен 0.115"
## [1] "95% ДИ для эффекта: [0.0148, 0.2398]"
Для унивариантной модели наблюдаем незначительное отклонение от предпосылок нормальности и гомоскедастичности распределения остатков при предсказании остроты зрения вдали, при этом явных признаков кластеризации остатков не обнаружено. Проведем коррекцию на гетероскедастичность.
Для унивариантной модели, предсказывающей лог-шкалированную остроту зрения вдали отклонения от нормальности и гомоскедастичности не наблюдается.
| Острота вблизи | Острота вблизи с коррекцией | Острота вблизи, log | |
|---|---|---|---|
| (Intercept) | 0.178 | 0.178 | −3.272 |
| [0.115, 0.240] | [0.120, 0.235] | [−3.876, −2.668] | |
| (<0.001) | (<0.001) | (<0.001) | |
| glauYes | −0.036 | −0.036 | −0.835 |
| [−0.135, 0.063] | [−0.139, 0.066] | [−1.786, 0.115] | |
| (0.465) | (0.482) | (0.084) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.009 | 0.049 | |
| R2 Adj. | −0.008 | 0.033 | |
| AIC | −25.5 | 88.5 | 255.2 |
| BIC | −19.1 | 216.1 | 261.6 |
| Log.Lik. | 15.747 | −124.624 | |
| F | 0.540 | 3.088 | |
| RMSE | 0.19 | 1.81 |
## [1] "Значение beta для модели после преобразования: 0.43 , 95% ДИ: [0.17, 1.12]"
## [1] "Уменьшение в 2.31 раз."
Статистика F и скорректированный R-квадрат, которые отражают долю вариабельности зависимой переменной, объясненную моделью, значительно выше для модели с лог-преобразованием, 3.1 vs 0.54 и 0.05 vs 0.01 соответсвенно. Это отлично, что модель после коррекции, предсказывающая непреобразованную переменную, и модель предсказывающая преобразованную переменную имеют одно направление для коэффициентов (отрицательные для группы с глаукомой), это показывает согласованность результатов.
Видим, что нижний ДИ для модели с коррекцией и модели, предсказывающая преобразованную переменную, не пересекает 0.
Интерпретация кооэффициентов. В группе с наличием глаукомы по сравнению с группой без глаукомы острота зрения вдали незначимо выше в среднем на 0.036 [−0.135, 0.063, 95% ДИ]. Результат для моделирования преобразованной переменной показывает, что в группе с наличием глаукомы острота зрения ниже в 2.31 раза (Коэффициент 0.43 [0.17, 1.12, 95% ДИ]), и хотя верхний ДИ выше 1, эта оценка значима на уровне 0.1. Отметим, что разные подходы к моделированию согласованны в направлении: оба они демонстрируют, что для наличия глаукомы показано значимое отрицательное влияние на зависимую переменную.
## [1] "Добавление переменной 'side' не было значимым на уровне значимости 0.1 для всех моделей."
Можем заключить, что, при отсутствии оснований исходя из анализа причинно-следственных связей и поскольку добавление этой переменной в модель не показывает улучшение модели ни в одном сеттинге, мы можем не добавлять этот предиктор для оценки связи наличия глаукомы с остротой зрения вдали.
Сделаем то же для переменной взаимодействия глаукомы и возраста.## [1] "Добавление переменной взаимодействия не было значимым на уровне значимости 0.1 для всех моделей."
Мы хотели учесть то, что, возможно с возрастом в группах с и без глаукомы, из-за прогрессирования последней, острота зрения будет изменятся по-разному. Эта гипотеза не подтвердилась, переменную взаимодействия можно убрать. Переменную для возраста и стратегии мы проверяли в прошлом задании.
Теперь для итоговой модели: bcdva ~ age_flwp+strat+glau проведем диагностику.Для модели с поправкой на ковариаты, предсказывающей остроту зрения вдали, как и в унивариантной модели видим небольшие отклонения от гомоскедастичности и от нормальности. Введем ту же коррекцию.
Для модели с поправкой на ковариаты, предсказывающей логарифмированную остроту зрения вдали, как и в унивариантной модели не видим отклонения от нормальности и гетероскедастичности.
| Острота вдали | Острота вдали с коррекцией | Острота вдали, log | |
|---|---|---|---|
| (Intercept) | 0.250 | 0.250 | −1.921 |
| [0.062, 0.438] | [0.028, 0.472] | [−3.674, −0.168] | |
| (0.010) | (0.028) | (0.032) | |
| age_flwp | −0.011 | −0.011 | −0.174 |
| [−0.027, 0.004] | [−0.030, 0.007] | [−0.321, −0.027] | |
| (0.151) | (0.217) | (0.021) | |
| stratArtephakia | 0.098 | 0.098 | 1.124 |
| [−0.005, 0.202] | [0.004, 0.192] | [0.158, 2.090] | |
| (0.062) | (0.040) | (0.023) | |
| glauYes | −0.032 | −0.032 | −0.817 |
| [−0.130, 0.066] | [−0.137, 0.073] | [−1.732, 0.097] | |
| (0.517) | (0.544) | (0.079) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.079 | 0.168 | |
| R2 Adj. | 0.031 | 0.125 | |
| AIC | −26.0 | 80.0 | 250.9 |
| BIC | −15.4 | 203.4 | 261.6 |
| Log.Lik. | 18.007 | −120.461 | |
| F | 1.649 | 3.916 | |
| RMSE | 0.18 | 1.69 |
## [1] "Значение beta (геометрическое среднее) для модели после преобразования: 0.44 , 95% ДИ: [0.18, 1.1]"
## [1] "Уменьшение в 2.27 раз."
Видим, что нижний ДИ для модели с коррекцией и модели, предсказывающая преобразованную переменную, не пересекает 0.
Интерпретация кооэффициентов. В группе с глаукомой по сравнению с группой без глаукомы острота зрения вдали ниже в среднем на 0.817 [−0.137, 0.073, 95% ДИ] при прочих равных условиях. Результат для моделирования преобразованной переменной показывает, что в группе с глаукомой острота зрения ниже в 2.27 раз (Коэффициент = 0.44, [0.18, 1.1, 95% ДИ] при прочих равных условиях, значимо на уровне значимости 0.1. Разные подходы к моделированию снова согласованны в направлении: оба они демонстрируют, что для группы с глаукомой показано отрицательное влияние на зависимую переменную при прочих равных условиях.
## [1] "Добавление переменной 'side' не было значимым на уровне значимости 0.1 для всех моделей."
Отлично, можем заключить, что для моделирования bcdva нам не нужны переменные взаимодействия.
Наша итоговая модель : bcdva ~ age_flwp+strat+glau уже была исследована.## [1] "Значение beta (геометрическое среднее) для модели после преобразования: 3.08 , 95% ДИ: [1.17, 8.08]"
Интерпретация кооэффициентов.
В группе со стратегией лечения Артефакия по сравнению со стратегией Афакия острота зрения вдали выше в среднем на 0.098 [0.004, 0.192, 95% ДИ] при прочих равных условиях, в том числе независимо от наличия глаукомы. Результат для моделирования преобразованной переменной показывает, что в группе Артефакии острота зрения выше в 3.08 [1.17, 8.08, 95% ДИ] раз при прочих равных условиях, в том числе независимо от наличия глаукомы. В обоих случаях нижние границы ДИ не пересекают границу 0, и 1 соответственно, т.е. полностью определены в положительной области. Эти результаты значимы на уровне 0.05. Разные подходы к моделированию снова согласованны в направлении: оба они демонстрируют, что для стратегии Артефакия показано значимое положительное влияние на зависимую переменную при прочих равных условиях.Для унивариантной модели наблюдаем очень незначительное отклонение от предпосылок нормальности при предсказании остроты зрения вблизи, при этом явных признаков кластеризации остатков и гетероскедастичности не обнаружено.
| Острота вблизи | Острота вблизи с коррекцией | Острота вблизи, logit | |
|---|---|---|---|
| (Intercept) | 0.345 | 0.345 | −0.993 |
| [0.254, 0.435] | [0.250, 0.440] | [−1.768, −0.300] | |
| (<0.001) | (<0.001) | (0.007) | |
| glauYes | −0.050 | −0.050 | −0.159 |
| [−0.192, 0.092] | [−0.189, 0.089] | [−1.376, 0.996] | |
| (0.485) | (0.474) | (0.789) | |
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.008 | ||
| R2 Adj. | −0.008 | ||
| AIC | 19.7 | 133.7 | 74.7 |
| BIC | 26.1 | 261.3 | 79.0 |
| Log.Lik. | −6.859 | −35.368 | |
| F | 0.493 | 0.071 | |
| RMSE | 0.27 | 0.44 |
## [1] "Значение OR для модели после преобразования: 0.85 , 95% ДИ: [0.25, 2.71], уменьшение в 1.17 раз."
В данном случае бинаризация переменной не сделала модель лучше, судя по F-статистике. для всех моделей стратегия не оказалась значимым предиктором, более того, для логистической и для линейной регрессии направление действия признака оказалось разным. Для логистической регрессии для группы артефакии показано незначимое снижение шанса иметь остроту зрения больше 0.05 для пациента в 1.2 раза (OR = 0.83 , 95% ДИ: [0.26, 2.68]). Для линейной регрессии интерпретацию дам ниже.
Интерпретация кооэффициентов. В группе с глаукомой, по сравнению с группой без глаукомы, острота зрения вблизи выше в среднем на -0.050 [−0.189, 0.089, 95% ДИ]. Верхняя граница ДИ находится в отрицательной области значений, ухудшение незначимо. Однако результаты моделей согласуются.## [1] "Добавление переменных не было значимым на уровне значимости 0.1 для всех моделей."
Можем заключить, что, как и в случае с остротой зрения вдали, гипотеза о разной остроте зрения по группам глаукомы не подтверждается. Более того, добавление глаукомы не улучшает модель. Тем не менее, добавим признак по заданию.
Теперь для итоговой модели: bcnva ~ age_flwp*strat+glau проведем диагностику. Моделирование с помощью логит-функции для бинаризованной переменной не показало себя хорошо в предыдущем анализе, поэтому далее будем работать только с линейной регрессией.Для модели с поправкой на ковариаты, предсказывающей остроту зрения вблизи, как и в унивариантной модели видим небольшие отклонения от гомоскедастичности, но не от нормальности. Введем ту же коррекцию.
| Острота вблизи, бейзлайн | Острота вблизи | Острота вблизи с коррекцией | |
|---|---|---|---|
| (Intercept) | 0.960 | 0.978 | 0.978 |
| [0.468, 1.452] | [0.478, 1.478] | [0.633, 1.323] | |
| (<0.001) | (<0.001) | (<0.001) | |
| stratArtephakia | −0.964 | −0.964 | −0.964 |
| [−1.545, −0.384] | [−1.549, −0.380] | [−1.397, −0.531] | |
| (0.002) | (0.002) | (<0.001) | |
| age_flwp | −0.065 | −0.065 | −0.065 |
| [−0.111, −0.018] | [−0.112, −0.018] | [−0.096, −0.034] | |
| (0.007) | (0.008) | (<0.001) | |
| stratArtephakia × age_flwp | 0.093 | 0.092 | 0.092 |
| [0.040, 0.145] | [0.040, 0.145] | [0.053, 0.132] | |
| (<0.001) | (<0.001) | (<0.001) | |
| glauYes | −0.034 | −0.034 | |
| [−0.167, 0.099] | [−0.159, 0.091] | ||
| (0.610) | (0.587) | ||
| Num.Obs. | 62 | 62 | 62 |
| R2 | 0.195 | 0.198 | |
| R2 Adj. | 0.153 | 0.142 | |
| AIC | 10.8 | 12.5 | 114.5 |
| BIC | 21.5 | 25.3 | 235.8 |
| Log.Lik. | −0.407 | −0.264 | |
| F | 4.669 | 3.523 | |
| RMSE | 0.24 | 0.24 |
## [1] "Отвергаем нулевую гипотезу об одновременном равенстве нулю коэффициентов для стратегии, возраста и их взаимодействия, p = 0.00664 . Факторы имеют статистически значимое влияние на зависимую переменную в модели."
ДИ для возраста, стратегии и их взаимодействия также не пересекают 0. То же подтверждает тестирование статистической гипотезы.
## [1] "Эффект артефакии при среднем возрасте 11.63 равен 0.111"
## [1] "95% ДИ для эффекта: [0.0048, 0.2311]"
| (1) | |
|---|---|
| stratArtephakia | −0.533 |
| [−1.582, 0.501] | |
| (0.313) | |
| Num.Obs. | 62 |
| AIC | 86.6 |
| BIC | 90.8 |
| Log.Lik. | −41.295 |
| F | 1.019 |
| RMSE | 0.49 |
## [1] "Значение OR для модели: 0.59 , 95% ДИ: [0.21, 1.65], уменьшение в 1.7 раз."
## [1] "Добавление переменной 'side' не было значимым на уровне значимости 0.1 для всех моделей."
Снова не находим добавлять “сторону операции”.
Сравним модель с и без взаимодействия для стратегии и возраста.## [1] "Добавление переменной взаимодействия не было значимым на уровне значимости 0.1 для всех моделей."
| (1) | |
|---|---|
| stratArtephakia | −0.427 |
| [−1.536, 0.671] | |
| (0.444) | |
| age_flwp | −0.050 |
| [−0.222, 0.122] | |
| (0.567) | |
| Num.Obs. | 62 |
| AIC | 88.3 |
| BIC | 94.6 |
| Log.Lik. | −41.131 |
| F | 0.664 |
| RMSE | 0.49 |
## [1] "Значение OR для модели: 0.65 , 95% ДИ: [0.22, 1.96], уменьшение в 1.53 раз."
ДИ для возраста и стратегии пересекают OR=1. В группе с артефакией шанс иметь глаукому ниже, незначимо.